Firma Alibaba opublikowała wczoraj nową wersję swojego modelu sztucznej inteligencji Qwen 2.5-Max, który według niej przewyższył DeepSeek-V3, ale nie DeepSeek-R1, który tak zamieszał ostanio.

Premiera Qwen 2.5-Max, w pierwszym dniu Księżycowego Nowego Roku, kiedy większość Chińczyków jest „wyjechana,” więc nie będzie miała ani okazji ani czasu zajmować się kolejnym chatbotem, wskazuje, że Alibaba znalazłą się pod presją ze strony DeepSeek. DeepSeek wstrząsnął krajowym sektorem Sztucznej Inteligencji (AI) chyba bardziej niż amerykańskim, co jednak umkneło mediom. Poprzednie modele DeepSeek V3, DeepSeek-V2, wywołały wojnę cenową modeli AI w Chinach. DeepSeek-V2 jest nie tylko open-source, ale też bezprecedensowo tani, tylko 1 RMB (0,14 USD) za 1 milion tokenów – lub jednostek danych przetwarzanych przez model AI – doprowadził do tego, że Alibaba ogłosiła obniżki cen nawet o 97% na szereg modeli.

Teraz Alibaba tak się śpieszył, że nawet nie przygotował raportu na temat nowego modelu, jaki zrobił DeepSeek. Twórcy oczywiście twierdzą, że „Qwen 2.5-Max przewyższa (…) prawie na całej planszy GPT-4o, DeepSeek-V3 i Llama-3.1-405B.” Osobiście poczekam na niezależne badania i oceny.

Nie tylko Alibaba czuje presję. Dwa dni po wydaniu DeepSeek-R1, właściciel TikTok, firma ByteDance, wydała aktualizację swojego flagowego modelu sztucznej inteligencji, który według niej osiągnął lepsze wyniki niż wspierany przez Microsoft OpenAI o1 w AIME, teście porównawczym, który mierzy, jak dobrze modele sztucznej inteligencji rozumieją i reagują na złożone instrukcje.

Teraz wszyscy będą twierdzić, że przegonili nie tylko Amerykanów, ale też DeepSeek. Mam wrażenie deja vu z czasów kampanii Wielkiego Skoku, tylko wtedy wszyscy się prześcigali z deklarowaniem wielkosci zbiorów. Czasy się zmieniają, ale system nadal prowokuje ludzi do tych samych błedów.

Nieznane's awatar

Opublikował/a Michał Bogusz

Dodaj komentarz

Ta witryna wykorzystuje usługę Akismet aby zredukować ilość spamu. Dowiedz się w jaki sposób dane w twoich komentarzach są przetwarzane.